Agent 开发的完整知识体系(全景图)
为了让你知道接下来要学什么,先给你一份总纲。Agent 系统由四大核心组成:
1. Agent Core:智能体本体
包含:
- 认知(LLM 或模型)
- 记忆(Memory)
- 工具调用(Tool Use)
- 规划(Planning)
- 执行(Action Execution)
常见架构:
- ReAct(Reason + Act)
- Reflexion(带总结性记忆)
- CoT Agent(链式推理 agent)
- Adaptive Agent(动态策略 agent)
- 多模态 agent(图文/视频/语音)
2. Multi-Agent System:多智能体协作框架
包括:
- Agent 间通信(message passing)
- 协商 / 任务分解(task negotiation)
- 层级管理(manager-worker)
- 角色分工(planner、explorer、executor…)
- 状态共享(blackboard,graph memory)
常用框架思想:
- AutoGen
- CrewAI
- LangGraph
- CAMEL
- Swarm
3. Tool & Environment:工具与环境集成
包括:
- API 工具
- 本地代码执行(Python sandbox)
- 搜索工具(web search)
- 数据库(知识库 agent)
- 浏览器 agent(playwright/selenium)
- 文件系统
- 自定义工具插件(function-calling)
4. Agent Infrastructure:部署与服务化
包括:
- 状态 管理(Memory store)
- 决策日志(Trace / Step / Graph)
- 任务编排(Workflow)
- 并发与防爆走机制(Safety)
- 多 agent 对话协议
- 本地与云端架构(边缘 + 云)
我们的学习路线
第 1 阶段:单智能体(Agent Core)
✓ LLM 作为决策引擎 ✓ ReAct / CoT / Reflexion 架构 ✓ 规划(Planner)与执行(Executor) ✓ Memory:短期、长期、检索式 ✓ 工具调用(function-calling) ✓ 状态机与可控 Agent
第 2 阶段:多智能体(Multi-Agent)
✓ Manager–Worker ✓ 竞赛式 Agent(debate) ✓ 协作式 Agent(swarm) ✓ 角色扮演(role-playing) ✓ 图结构 Agent 系统(LangGraph)
第 3 阶段:工具与环境集成
✓ 浏览器 Agent(自动化 + 搜索) ✓ Python 工具库 ✓ API 工具编排 ✓ 文件/数据库 agent ✓ 自定义工具系统
第 4 阶段:大项目实战**
你最终可以做出:
- 互联网信息自动挖掘系统(MemeMiner)
- 实时舆情追踪 + 传播链分析 agent
- 网站深度爬取 agent
- 数据分析 agent pipeline
- 企业级 task-oriented agent